智能论文笔记

A Best-of-Both-Worlds Algorithm for Bandits with Delayed Feedback

Saeed Masoudian , Julian Zimmert , Yevgeny Seldin

分类：机器学习 | (统计)机器学习

2022-06-29

我们提出了对Zimmert和Seldin [2020]算法的修改调整，用于对抗性的多型匪徒，并具有延迟的反馈，除了Zimmert和Seldin的最小值最佳对抗性遗憾保证外，还可以同时获得近乎遗憾的遗憾。有固定的延迟。具体而言，对抗性遗憾保证是$ \ Mathcal {o}（\ sqrt {tk} + \ sqrt {dt \ log k}）$，其中$ t $是时间范围，$ k $是武器数量，并且$ d $是固定的延迟，而随机遗憾保证是$ \ Mathcal {o} \ left（\ sum_ {i \ neq i^*}（\ frac {1} {\ delta_i} \ log log（t） frac {d} {\ delta_ {i} \ log k}） + d k^{1/3} \ log k \ right）$，其中$ \ delta_i $是次优差距。我们还向任意延迟的情况提供了算法的扩展，该算法基于对最大延迟$ d_ {max} $的甲骨文知识，并获得$ \ mathcal {o}（\ sqrt {\ sqrt {tk} + \ sqrt { d \ log k} + d_ {max} k^{1/3} \ log k）$在对抗性方案中遗憾，其中$ d $是总延迟，$ \ mathcal {o} \ left（\ sum_ {\ sum_ { i \ neq i^*}（\ frac {1} {\ delta_i} \ log（t） + \ frac {\ sigma_ {max}}} {\ delta_ {i} {1/3} \ log k \ right）$在随机制度中遗憾，其中$ \ sigma_ {max} $是最大的杰出观测值。最后，我们提出了一个下限，与Zimmert和Seldin [2020]在对抗环境中的跳过技术所达到的遗憾上限相匹配。

translated by 谷歌翻译

对于数字化或索引物理文档，光学特征识别（OCR）是从扫描文档中提取文本信息的过程，是一项重要技术。当文档在视觉上损坏或包含非文本元素时，现有技术会产生差的结果，因为错误的检测结果可能会极大地影响OCR的质量。在本文中，我们提出了一个针对商务文件的businet的检测网络。业务文件通常包括敏感信息，因此无法将其上传到OCR的云服务。Businet被设计为快速和轻巧，因此可以在本地避免使用隐私问题。此外，Businet旨在使用专门的合成数据集来处理扫描的文档损坏和噪声。通过采用对抗性训练策略，该模型可实现可观的噪音。我们对可公开可用的数据集进行评估，以证明我们的模型的有用性和广泛适用性。

translated by 谷歌翻译